期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于数据增强和弱监督对抗训练的中文事件检测
罗萍, 丁玲, 杨雪, 向阳
《计算机应用》唯一官方网站    2022, 42 (10): 2990-2995.   DOI: 10.11772/j.issn.1001-9081.2021081521
摘要621)   HTML50)    PDF (720KB)(298)    收藏

当前的事件检测模型严重依赖于人工标注的数据,在标注数据规模有限的情况下,事件检测任务中基于完全监督方法的深度学习模型经常会出现过拟合的问题,而基于弱监督学习的使用自动标注数据代替耗时的人工标注数据的方法又常常依赖于复杂的预定义规则。为了解决上述问题,就中文事件检测任务提出了一种基于BERT的混合文本对抗训练(BMAD)方法。所提方法基于数据增强和对抗学习设定了弱监督学习场景,并采用跨度抽取模型来完成事件检测任务。首先,为改善数据不足的问题,采用回译、Mix-Text等数据增强方法来增强数据并为事件检测任务创建弱监督学习场景;然后,使用一种对抗训练机制进行噪声学习,力求最大限度地生成近似真实样本的生成样本,并最终提高整个模型的鲁棒性。在广泛使用的真实数据集自动文档抽取(ACE)2005上进行实验,结果表明相较于NPN、TLNN、HCBNN等算法,所提方法在F1分数上获取了至少0.84个百分点的提升。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于HHT-MFCC和短时能量的慢性阻塞性肺病患者呼吸声识别
常峥, 罗萍, 杨波, 张晓晓
计算机应用    2021, 41 (2): 598-603.   DOI: 10.11772/j.issn.1001-9081.2020060881
摘要398)      PDF (1298KB)(662)    收藏
为了优化梅尔频率倒谱系数(MFCC)特征提取算法,提高对呼吸声信号识别的准确率,实现识别慢性阻塞性肺病(COPD)的目的,提出了基于希尔伯特黄变换(HHT)的MFCC与短时能量(Energy)融合的特征提取算法HHT-MFCC+Energy。首先,经预处理的呼吸声信号通过HHT计算出Hilbert边际谱和边际谱能量;其次,谱能量通过Mel滤波器得到特征向量,再对特征向量取对数和进行离散余弦变换得到HHT-MFCC系数;最后,将信号的短时能量与HHT-MFCC特征向量融合形成新特征,并通过支持向量机(SVM)进行信号识别。将MFCC、HHT-MFCC和HHT-MFCC+Energy三种特征提取算法结合SVM进行呼吸声信号识别,实验结果表明,所提出的特征融合算法在COPD患者和健康人呼吸声识别效果上都优于其他两种算法:当提取24维特征、选取100个训练样本时,识别率平均值能达到97.8%,分别比MFCC和HHT-MFCC高出6.9个百分点和1.4个百分点。
参考文献 | 相关文章 | 多维度评价